Openai Slashes AI модел за тестване на безопасността

Openai понижи времето и ресурсите, които прекарва за тестване на сигурността на мощните си модели на изкуствен интелект, повдигайки опасенията, че неговата технология се изхвърля без задоволително внимание. В съпоставяне с няколко месеца по-рано.

Според осем души, осведомени с процесите на тестване на Openai, тестванията на стартирането са станали по-малко задълбочени, с незадоволително време и запаси, отдадени на идентифициране и намаляване на рисковете, защото стартирането на 300 милиарда $ е подложен на напън за бързо освобождение на нови модели и опазване на конкурентното си преимущество. ; “But because there is more demand for it, they want it out faster. I hope it is not a catastrophic mis-step, but it is reckless. This is a recipe for disaster. ”

The time crunch has been driven by “competitive pressures ”, according to people familiar with the matter, as OpenAI races against Big Tech groups such as Meta and Гугъл and start-ups including Elon Musk’s xAI to cash in on the cutting-edge Технология.

Няма световен стандарт за тестване за сигурност на AI, само че от по -късно тази година Законът за ИИ на Европейски Съюз ще принуди фирмите да организират проби за сигурност при най -мощните си модели. Преди това AI групите, в това число Openai, са подписали доброволни задължения с държавните управления във Англия и Съединени американски щати, с цел да разрешат на откривателите от институтите за сигурност на AI да тестват модели.

Openai упорства да пусне новия си модел O3 още през идната седмица, като дава по -малко от седмица на някои тестери за инспекциите им за сигурност, съгласно хората, познати с въпроса. Тази дата на издаване може да предстои на смяна.

Преди това OpenAI позволи няколко месеца за проби за сигурност. За GPT-4, който беше стартиран през 2023 година, тестерите имаха шест месеца да организират оценки преди да бъдат пуснати, съгласно хора, осведомени с въпроса.

Един човек, който е тествал GPT-4, съобщи, че някои рискови благоприятни условия са открити единствено два месеца в тестването. „ Те просто не дават приоритет на публичната сигурност “, споделиха те за сегашния метод на Openai.

„ Няма правилник, който споделя, че [компаниите] би трябвало да осведомят обществеността за всички страшни благоприятни условия. И също по този начин те са под доста напън, с цел да се състезават един различен, тъй че да не стопират да ги създадат по-способни “, сподели Даниел Кокотайло, някогашен изследователка на Openai, който в този момент е подложено на не-пакет, с цел да се състезава един различен, тъй че да не стопират да ги вършат по-способни “, сподели Даниел Кокотайло, някогашен откривател на Openai, който в този момент е подложено на групата, с цел да се състезава един различен, тъй че да не стопират да ги вършат по-способни “, сподели Даниел Кокотайло, някогашен откривател на Openai, който в този момент е подложено на групата, с цел да се състезава един различен, тъй че да не стопират да ги вършат по-способни “, сподели Даниел Кокотайло, някогашен откривател на Openi Project.

Openai преди този момент се е заел с построяването на персонализирани версии на своите модели за оценка на евентуална корист, като да вземем за пример дали неговата технология може да помогне да се направи биологичен вирус по-преносим.

Подходът включва обилни запаси, като да вземем за пример сглобяване на набори от данни от профилирана информация като вирусология и зареждане на модела за образование на това в техника, наречена Fine-Tuning. Изберете да прецизирате по-стар, по-малко кадърен модел, вместо по-мощните и усъвършенствани.

Докладът за сигурност и продуктивност на започващия за O3-Mini, по-малкият му модел, оповестен през януари, се базира на това по какъв начин по-ранният му модел GPT-4O съумя да извърши избрана биологична задача единствено когато е фина надъхан. Openai обаче в никакъв случай не е съобщавал по какъв начин по-новите му модели, като O1 и O3-Mini, също биха оценили, в случай че бъдат прецизирани.

„ Страхотен е Openai, задайте толкоз висока лента, като се ангажирате с тестване на персонализирани версии на техните модели. Но в случай че не се следва по този ангажимент, обществеността заслужава да знае “, споделя Стивън Адлер, някогашен откривател на сигурността на Openai, който е написал блог за тази тематика.

„ Не вършат такива проби, може да значи Openai и другите компании от AI са подценяващи по -нататък от техните проби, може да значи, че техните модели могат да знаят други. Добавено.

Хората, осведомени с сходни проби, обявиха, че носят големи разноски, като наемане на външни специалисти, създавайки характерни набори от данни, както и потребление на вътрешни инженери и изчислителна мощ.

Openai съобщи, че е направил успеваемост в процесите на оценка, в това число автоматизирани проби, които доведоха до понижаване на времевите рамки. Той добави, че няма контрактувана рецепта за подходи като фина конфигурация, само че беше решително, че методите му са най-хубавите, които могат да създадат и са направени транспарантни в своите отчети.

Той добави, че моделите, изключително за пагубни опасности, са усърдно тествани и смекчени за сигурност.

FT Swamp Notes Company в действителност се интересуват от сигурността? Премиум наличие

„ Имаме добър баланс какъв брой бързо се движим и какъв брой сме задълбочени “, споделя Йоханес Хайдеке, началник на системите за сигурност.

Друго предизвикателство е, че тестванията за сигурност постоянно не се организират на крайните модели, пуснати на обществеността. Вместо това, те се правят на по-ранните по този начин наречени контролно-пропускателни пунктове, които по-късно се актуализират за възстановяване на продуктивността и опциите, с „ почтифинални “ версии, посочени в отчетите за сигурност на системата на Openai.

„ Лоша процедура е да пуснете модел, който е друг от този, който сте оценили “, сподели някогашен механически чиновник на Openai.

Източник: ft.com